Видеотехнологии
«Урок цифры» — всероссийская образовательная акция, в рамках которой школьники с 1 по 11 класс смогут в игровой форме познакомиться с основами программирования и погрузиться в увлекательный мир цифровых технологий.
«Урок цифры» продлится с 21 ноября по 18 декабря 2022 года! Уроки пройдут в каждой школе во всех учебных параллелях с 1 по 11 класс. Попробуй свои силы на «Уроке цифры»!
«Урок цифры» по теме «Видеотехнологии» посвящён разбору понятий, практических задач и профессий, связанных с видеотехнологиями, так, чтобы охватить тему видеотехнологий от принципов работы видео до способов применения машинного обучения и искусственного интеллекта в современных видеосервисах.
В уроке мы используем упрощённые варианты терминов и определений:
- Кодек — это программа, которая используется для сжатия видеофайла или аудиофайла. Сжатие происходит за счет того, что сохраняются только изменения, а повторяющиеся фрагменты изображений удаляются из памяти.
- Буфер — область памяти, которая используется для временного хранения информации.
- Пиксель — наименьший элемент цифрового изображения. Из множества пикселей разных цветов получается изображение.
- Разрешение — это количество пикселей в измерении высоты и ширины цифрового изображения.
- Алгоритм — четко определенная последовательность действий, которые нужно сделать, чтобы достичь желаемого результата.
Давайте попробуем вспомнить, где в повседневной жизни каждый из нас использует видеотехнологии.
Мы смотрим фильмы, обучающие видео, снимаем ролики на смартфоны и делимся ими с друзьями, звоним близким по видеосвязи — и всё это благодаря развитию видеотехнологий.
Сегодня использование видео имеет безграничные возможности. Это важная технология для образования, спорта, игр, медицины, бизнеса и других сфер.
Какие свойства видео важны, чтобы нам было удобно использовать видеоролики или трансляции для своих целей?
Очень важны для нас качество — чтобы изображение не расплывалось и было чётким, — и вес видео: чем меньше весит видеозапись, тем быстрее она будет загружаться. А если видео тяжёлое, понадобится больше времени для загрузки, а ещё оно может приостанавливаться.
Видео — это быстро сменяющие друг друга кадры на определенной скорости.
Чтобы представить себе, что такое цифровое видео, возьмем набор изображений, которые расположились в нужном нам порядке и сменяют друг друга с определенной частотой (например, 30 кадров в секунду (или fps — frames per second, то есть «кадров в секунду»)).
Каждое такое изображение состоит из пикселей — маленьких точек разных цветов, которые и образуют картинку. Чем больше пикселей, тем более гладким получается изображение, но и хранить нужно больше информации, поэтому вес каждого кадра и видео в целом растёт.
Давайте для примера посчитаем, сколько может весить 10- секундный видеоролик в хорошем качестве (1920*1080), если кадры меняются со скоростью 60 штук в секунду, а для хранения каждого пикселя используется 3 байта, по байту на каждый цвет.
1920 * 1080 * 3 байта (=24 бита) * 10 с * 60 fps = 3,4 ГБ
Это очень большой вес для такого короткого видео, поэтому используются кодеки — программы, которые сжимают файлы, и могут уменьшить вес ролика в 850 раз, так что вес целого фильма, а не 10-секундного ролика, поместится в объем памяти в 3.4 Гб.
Бывает, что нужно созвониться на двоих, иногда собрать группу людей или провести онлайн-мероприятие на большое число человек. Ограничений по количеству участников быть не должно. И при этом хочется, чтобы все могли подключаться с видео, а не просто смотреть на других.
Когда спикер включает демонстрацию экрана с презентацией, нужно, чтобы качество картинки было очень чётким. А на небольшом экране смартфона слайд можно было бы приблизить на самом устройстве. И чтобы звонки работали на любых платформах и устройствах в условиях мобильного нестабильного интернета. И всё это бесплатно.
Теперь переведем эти пожелания пользователей на язык требований к технологиям платформы.
Вот что получится, если поставить задачу на создание сервиса видеозвонков:
- неограниченное число участников;
- работа на всех платформах (мобильные и десктопы);
- низкое потребление серверных ресурсов;
- высокое качество, которое складывается из стабильности, низких задержек, высокого разрешения видео, демонстрации экрана без артефактов (искажения изображения, рябь и мерцания) и т.д.;
- низкое потребление ресурсов на пользовательских устройствах — чтобы качество было высоким для пользователей с разными возможностями устройства по техническим характеристикам.
Кстати, чем чаще один пользователь созванивается по видео, тем сервис быстрее подстраивается под ваши настройки. Почему так происходит? Здесь в игру вступает искусственный интеллект, а именно — нейросети.
Нейросети лучше других алгоритмов сейчас справляются со сложно структурированными данными, а это как раз и есть видео, картинки и тексты.
Так вот, если часто звонить друг другу в VK Звонках, то нейросеть будет обрабатывать запросы и собирать необходимые данные, делая их подстройку между собой более качественной.
Искусственный интеллект становится незаменимым помощником в развитии видеозвонков. Вот ещё несколько примеров его применения:
- выделения речи человека из шума или тишины;
- шумоподавление;
- улучшение изображения и улучшения лица;
- оценка качества звонков.
Чтобы угадывать интересы пользователя, на большинстве крупных видеоплатформ используют рекомендательные системы. Это математический алгоритм, который учитывает огромное количество данных: что вам нравится, на кого вы подписаны, что смотрят люди, похожие на вас по профилю, как долго вы смотрите конкретные видео, как быстро переключаетесь между клипами и так далее.
Чем больше времени вы пользуетесь сервисом и взаимодействуете с контентом, тем лучше алгоритмы понимают, что вам интересно и что из контента стоит предложить.
Рекомендательные системы, как и другие алгоритмы искусственного интеллекта, создаются Data Scientist’ами (исследователями данных).
Если обобщить, то это специалисты, которые разрабатывают программы для анализа массивов сложных данных и помогают таким образом решать бизнес-задачи.
В том числе Data Scientist’ы разрабатывают десятки нейросетей, которые способны проанализировать видео сразу при загрузке.
На видео распознаются отдельные элементы и признаки, происходит тегирование. Если набор тегов совпадёт с интересами пользователя, то алгоритм порекомендует ему это видео.
Если Вы заинтересовались темой урока, то попробуйте все вместе принять участие в конкурсе коротких вертикальных роликов по теме урока.
Чтобы лучше понять свойства видео и узнать, какие принципы и алгоритмы используются при создании, хранении и воспроизведении видеороликов, давайте запустим игровые тренажёры.
В тренажерах есть подсказки. Их легко найти в левом верхнем углу — значок шестиугольника со знаком вопроса: используйте подсказки только тогда, когда понимаете, что попробовали все свои догадки.
Добавить комментарий